گروه مهندسی برق

جلسه دفاع از رساله دکترا آقای نریمان عبدی

جلسه باعنوان یادگیری عمیق با داده‌های محدود روی لبه: راهکاری برای بهبود سامانه‌های بازشناسی علائم ترافیکی ، در تاریخ چهارشنبه 1404/01/20 برگزار می گردد.

 

جلسه دفاع از رساله دکترا آقای نریمان عبدی، باعنوان یادگیری عمیق با داده‌های محدود روی لبه: راهکاری برای بهبود سامانه‌های بازشناسی علائم ترافیکی ، در تاریخ چهارشنبه 1404/01/20 ساعت 10 در اتاق شورا ساختمان صناعت برگزار می گردد.



اساتید راهنما: آقای دکتر فرزاد پرورش، آقای دکتر محمدفرزان صباحی



چکیده: یکی از ویژگی‌ها انسان در شناسایی علائم ترافیکی، شناسایی علائم جاده‌ای با مشاهده یک تصویر الگو از هر علامت راهنمایی و رانندگی است. در سامانه‌های هوشمند شناسایی علائم ترافیکی انتظار می‌رود که این سامانه‌ها بتوانند با مشاهده تصاویر الگوی علائم ترافیکی، آن‌ها را در شرایط واقعی شناسایی کنند. این فرآیند می‌تواند به کمک الگوریتم‌های یادگیری ماشین تک شات‌ انجام شود. شناسایی اشیاء به صورت تک شات‌ یکی از چالش‌های مهم شبکه‌های عصبی عمیق است که در آن، یک مدل عمیق نمونه‌های پرس‌وجو را بر اساس تصاویر پشتیبان طبقه‌بندی می‌کند. این چالش زمانی دشوارتر می‌شود که یک شیفت دامنه میان نمونه‌های پشتیبان و پرس‌وجو وجود داشته باشد. تعمیم‌دهی یک مدل عمیق به دامنه‌های ناشناخته با توزیع‌های متفاوت، یکی دیگر از چالش‌های مهم در شناسایی تک شات‌ای است. پردازش لبه با چالش‌هایی مانند محدودیت منابع محاسباتی و نیاز به مصرف انرژی پایین در دستگاه‌های محدود منابع روبرو است، که اجرای مدل‌های پیچیده یادگیری عمیق را دشوار می‌سازد. از سوی دیگر، یادگیری با تعداد نمونه محدود نیز یک مسئله مهم است، زیرا بسیاری از مدل‌های یادگیری عمیق برای عملکرد بهینه به مجموعه‌های داده بزرگ نیاز دارند. این چالش زمانی پیچیده‌تر می‌شود که مدل‌ها باید به داده‌های ناشناخته یا دامنه‌های جدید تعمیم یابند. بهبود عملکرد در چنین شرایطی نیازمند طراحی مدل‌هایی است که بتوانند با بهره‌گیری از منابع محدود، دقت و کارایی مطلوبی ارائه دهند و در عین حال، به خوبی با داده‌های کم‌حجم سازگار شوند. این پژوهش، شبکه عمیق جدیدی به نام SeqNet را معرفی می‌کند که برای غلبه بر مشکلات مذکور طراحی شده است. بر اساس دانش ما، این پژوهش در بازشناسی تک شات‌ای علائم راهنمایی و رانندگی و همچنین بازشناسی تک شات‌ای لوگو، عملکرد بهتری نسبت به مدل‌های موجود ارائه می‌دهد. مدل پیشنهادی SeqNet قادر است بدون نیاز به تنظیم مجدد (Fine-tuning) مدل بر روی داده‌های آزمون، به دامنه‌های نادیده تعمیم یابد. در این پژوهش نشان داده‌ایم که استفاده از دانش انتقال‌یافته از یک دامنه بزرگ اما نامرتبط می‌تواند به کاهش پارامترهای شبکه و در نتیجه کاهش اندازه مدل منجر شود. با بهره‌گیری از قدرت دانش انتقال‌یافته از یک مدل عمیق بزرگ، معماری SeqNet تا ? برابر پارامترهای کمتری نسبت به رقبا دارد. اندازه کوچکتر معماری SeqNet آن را به گزینه‌ای مناسب برای استفاده در دستگاه‌های محدود منابع، از جمله وسایل نقلیه هوشمند، تبدیل کرده است. نتایج تجربی نشان می‌دهد که عملکرد پیشنهادی SeqNet با حاشیه‌های قابل‌توجهی بهبود یافته است، به‌طوری‌که دقت در وظایف طبقه‌بندی تک شات‌ای تا ?? درصد و مساحت زیر منحنی (AUC) در وظایف بازیابی تصویر تا ?? درصد افزایش یافته است. از سوی دیگر از آنجایی که بازشناسی علائم راهنمایی و رانندگی یکی از مهم‌ترین بخش‌های سامانه‌های پیشرفته دستیار راننده (ADAS) به شمار می‌روند و این سامانه‌ها معمولاً بر روی دستگاه‌های جاسازی‌شده با منابع محاسباتی و حافظه محدود پیاده‌سازی می‌شوند، لذا برای بازشناسی علائم ترافیکی به روش‌های بازشناسی با تأخیر پایین نیاز دارند تا بتوانند در سریع‌ترین زمان ممکن به ورودی پاسخ دهند. اگرچه شبکه‌های عمیق بزرگ عملکرد بالایی در بازشناسی علائم راهنمایی و رانندگی نشان داده‌اند، اما نمی‌توانند نیازهای مربوط به تأخیر پایین در سامانه‌های جاسازی‌شده را برآورده کنند. در ادامه این پژوهش، ما مدلی فشرده با کمتر از ?.? میلیون پارامتر به نام DiSeqNet پیشنهاد داده که این مشکلات را به‌صورت انتها‌به‌انتها حل می‌کند. مدل پیشنهادی ما از تمامی روش‌های پیشرفته موجود عملکرد بهتری دارد. عملکرد این مدل بر روی یک سخت¬افزار با منابع محدود رزبری پای 4 ارزیابی شده است.
تاریخ:
1403/12/20
تعداد بازدید:
65
منبع:
دانشگاه اصفهان

آدرس: اصفهان، میدان آزادی، دانشگاه اصفهان،میدان خوارزمی، ابتدای بلوار سلامت، ساختمان انصاری
کدپستی: 8174673441
تلفن: 37932685 تلفکس: 36682887
راهنمای جامع تلفن های دانشگاه اصفهان

Powered by DorsaPortal